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METODY TEORII GIER W STEROWANIU STATKIEM 


Streszczenie: W referacie sformułowano problem sterowania procesem jako grą dynamiczną j 
obiektów. Opisano zakres zastosowań gier dynamicznych w technice sterowania. Zaprezentowano 
algorytmy gry pozycyjnej i gry macierzowej na przykładzie wyznaczania bezpiecznej trajektorii 
rozgrywającej statku w sytuacji kolizyjnej. Rozważania zilustrowano wynikami komputerowej 
symulacji w języku Matlab/Simulink bezpiecznych trajektorii statku w rzeczywistej sytuacji 
nawigacyjnej na morzu. Przedstawiono charakterystyki wrażliwości sterowania rozgrywającego na 
niedokładność informacji o stanie procesu i na zmiany jego parametrów. 


Słowa kluczowe: Gry dynamiczne, programowanie liniowe dualne, sterowanie statkiem, symulacja 
komputerowa, wrażliwość sterowania. 


1. GRY DYNAMICZNE W TECHNICE STEROWANIA 


Uwzględniając postać wskaźnika jakości można zagadnienia sterowania optymalnego 
procesami technicznymi podzielić na trzy grupy, takie dla których: 
- koszt przebiegu procesu jest jednoznaczną funkcją sterowania, 
- koszt przebiegu procesu zależy od sposobu sterowania i od pewnego zdarzenia przypadkowego 

o znanym opisie statystycznym, 
- koszt przebiegu procesu jest określony wyborem sposobu sterowania i pewnym czynnikiem 
nieokreślonym, o nie znanym opisie statystycznym. 

Ostatnia grupa zagadnień dotyczy rozgrywających układów sterowania, których syntezę 
prowadzi się metodami teorii gier. Teoria gier jest działem współczesnej matematyki, 
obejmującym teorię sytuacji konfliktowych, budowę i analizę ich modeli. Konflikt może być: 
wojskowy, polityczny, społeczny, ekonomiczny, w grze towarzyskiej, w grze z naturą, w 
realizacji procesu sterowania podczas oddziaływania zakłóceń lub innych obiektów sterowania. 
Grą w ujęciu teorii sterowania nazywa się proces złożony z kilku obiektów sterowania 
pozostających ze sobą w sytuacji konfliktowej, bądź proces z nieokreślonymi zakłóceniami lub z 
niepełną informacją. 
Gracze są to strony - obiekty sterowania, uczestniczące w sytuacji konfliktowej. Strategia jest 
zbiorem reguł działania - sterowania gracza, których nie mogą zmienić działania przeciwnika lub 
natury. Strategie realizuje: człowiek, automat, regulator, komputer. Strategie mogą być czyste 
jako elementy zbioru strategii lub mieszane jako rozkład prawdopodobieństwa na zbiorze 
strategii czystych. Wypłatę stanowi wynik gry w postaci wygranej/przegranej lub w postaci 
prawdopodobieństwa realizacji pewnego działania — sterowania [1]. 
Pierwszą koncepcję teorii gier oraz twierdzenie o minimaksie sformułował E. Borel (1921, 1927). 
Pierwszą polską pracą z teorii gier jest praca H. Steinhausa (1925). Głównymi twórcami teorii 
gier są: John von Neumann (1928) oraz O. Morgenstern (1944). 


Największą klasę gier, mogących znaleźć zastosowanie przy rozgrywającym sterowaniu 
procesami technicznymi, a wśród nich sterowaniu ruchem statku, reprezentują gry dynamiczne 
różniczkowe. 

Zastosowaniem teorii gier dynamicznych w teorii sterowania, w tym i do sterowania ruchem 
statku zajmowali się: W.H. Fleming (1957-1964), L.S. Pontriagin (1964-1966), R. Isaacs (1965), 
N.N. Krasovski (1965-1974), W.P. Paciukov (1968-1976), A.W. Merz, J.S. Karmarkar (1976), J. 
Kazimierczak (1973), T. Miloh, S.D. Sharma (1977), V. Kudriaszov, J. Lisowski (1979-1980), Z. 
Zwierzewicz (1994), P.N. Tiep, J. Lisowski (1993-1997), J. Lisowski (1979-2013). 


1.1. Zasada sterowania 


Proces sterowania opisany jest przez układ równań stanu: 


X =F App eo Xp Xp ورلا‎ U.„U Ef) 1=12,..n J=12,..,m (1) 


rn?‏ و 


gdzie: 
x(t)=l[ x(t ),..,x,(t)] —n wymiarowy wektor stanu określony w przedziale czasu te[t,,t,], 
u jf t)=[ 31 1 Josie (t)]-v j wymiarowy wektor sterowania j-tego gracza (obiektu sterowania) 


należący do zbioru dopuszczalnych strategii Uj(x,t). 
Funkcje wektorowe: 


X(t), ,(t), f(xput) (2) 


charakteryzują się własnościami ogólnie przyjętymi w teorii sterowania optymalnego. 

Synteza rozgrywającego układu sterowania prowadzi do wyznaczenia optymalnych strategii 
graczy określających najbardziej korzystne w danych warunkach przeprowadzenie procesu. W 
zależności od klasy gry można wyróżnić różne sformułowanie optymalnego rozwiązania gry. Tak 
więc dla klasy często rozpatrywanych w technice sterowania gier niekoalicyjnych najbardziej 
korzystnym postępowaniem j-tego gracza jest maksymalizacja, bądź minimalizacja, swojej 
funkcji celu danej w postaci następującego funkcjonału: 


1 
Ilut 1ازلا...,[‎ ),..sU,,( 1 ([ = | fyl Z Up j. Jdt + K[ x(t, J x(t, )] (3) 
to 
gdzie: foj — wypłata całkowa, K — wypłata końcowa. 
Rozwiązanie gry stanowią strategie graczy u,(t)eU ;, dla których spełniona jest nierówność: 


IDA EYe IEZEDACZWE TOAST AC, (4) 


Tak więc strategie 34 t) prowadzą do sytuacji równowagi gry określonej przez tzw. punkty 
Nasha. 
Sterowanie optymalne j-tego gracza u; t) wyznacza się z następującej zależności: 


PURGI Ut) Ut) ać (1 yoo UR (1 )] = max LLU; (t yoo W(t), u (AU زخو أي‎ (t)] (5) 
u;(tjeU, 


Przy dowolnie przyjętych strategiach u,(tjeU, k#m, (m-1) graczy i warunkach 
początkowych x;(t, )=x,,, współrzędne stanu procesu i wartość funkcjonału zależą tylko od 
strategii uj(t) j-tego gracza. Uwzględniając powyższe, zadanie syntezy rozgrywającego układu 
sterowania rozwiązuje się w dwóch etapach, odpowiadającym dostatecznym i koniecznym 
warunkom istnienia rozwiązania gry m uczestników. 

Stosując rozszerzoną przez Isaacsa oraz Krotova postać równania funkcyjnego programowania 
dynamicznego dla procesów mających charakter gry różniczkowej, otrzymuje się warunki 
dostateczne maksimum funkcjonału J; w postaci : 


min[ VIX, t) FU U patot) fo Ayt eta t AVEN r= 
uj(t)eU; (6) 
K[ x(t, J] +V (x,t, )=0 j=12,...,m 


Jeżeli istnieje funkcja V'/’(x,t) spełniająca powyższe związki, to dopuszczalna strategia j-tego 


gracza u;( U15... j-1 jj... Ut) jest optymalną przy dowolnie przyjętych strategiach 
u,(t)eU,(k= j) (m-1) graczy, w szczególności przy strategiach optymalnych u;(t)eU;,, dla 


których zachodzi równanie: 


WERA N myl jaj wt) (7) 
Rozwiązanie powyższego układu m równań względem optymalnych strategii uj ma postać: 
x = 1 ( 
Ue RAVE eae) (8) 


Warunki konieczne maksimum funkcjonału J; przy dowolnie przyjętych strategiach u,(t)eU, 
przyjmują postać analogiczną do zasady maksimum Pontriagina: 
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Rozwiązanie tak sformułowanych zależności ma postać: 
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* 1> (j) * * * 
u;=g;(x,4 Up Uj U jp Ut) (11) 


bądź bezpośrednio 
uj AA x440) (12) 


Szczególnym przypadkiem gry różniczkowej j uczestników jest gra konfliktowa dwóch 
uczestników P (pursuit) i E (escape), dla której istnieją trzy warunki optymalności: min max, max 
min i punkt siodłowy. 


1.2. Rodzaje sterowania 


Ogólnie rozróżnia się dwa rodzaje sterowania rozgrywającego: programowe u(t) i 
pozycyjne uj[x(t),t]. Podstawowymi układami sterowania rozgrywającego są układy 
rozgrywające pozycyjnego sterowania procesami, tj. układy ze sprzężeniem zwrotnym, 
reprezentujące pozycyjne gry różniczkowe. Pozycją p(t) procesu sterowania nazywa się wektor: 


p(t)= p[ X(t), t] )13( 


Odpowiednio z wybranymi sposobami sterowania: U;,...U,...Um urządzenia sterujące 
poszczególnych obiektów, uwzględniając rzeczywistą pozycję p(t), formują według zasady 
sprzężenia zwrotnego działania sterujące: u;(t ),..u;(t),...u„(t), które bezpośrednio sterują 
procesem w chwili f. Zbiory dopuszczalnych strategii: 


Ui[p(t)],.... Ulp], Um[p(t)] (14) 


są funkcją pozycji procesu p(t), a więc są mniej lub bardziej zależne od siebie, tzn. wybór tego 
lub innego sterowania w;(t) zmienia zbiory dopuszczalnych strategii innych obiektów. Tak więc w 
zależności od celów poszczególnych graczy, określonych przez pewne zbiory M; w przestrzeni 
stanu (x/,...Xi,...Xn), wynika charakter konfliktowy danego procesu jako gry różniczkowej. 


1.3. Zakres zastosowań 


Ogólnie można rozróżnić trzy klasy problemów sterowania, w których istnieją możliwości 
wykorzystania gier dynamicznych, zarówno do opisu i syntezy sterowania optymalnego: 

- sterowanie obiektem przy braku jakichkolwiek informacji o oddziaływujących na niego 
zakłóceniach, dane są wówczas równania stanu obiektu oraz zbiór dopuszczalnych sterowań U, 
należy wyznaczyć sterowanie u*(t) zapewniające minimum funkcjonału przy warunku, że 
zakłócenie z(t) dąży do maksimum tego samego funkcjonału, tj. trzeba rozwiązać grę 
różniczkową przy min max warunku optymalności. 

- sterowanie obiektem przy spotkaniu z większą ilością obiektów ruchomych o różnych 
wskaźnikach jakości i celach końcowych. Przykładem może być proces sterowania statkiem w 
sytuacjach kolizyjnych przy spotkaniu z większą ilością obiektów ruchomych i nieruchomych 
(statki, przeszkody podwodne, linia brzegowa itp.), jako gra różniczkowa m uczestników. 


- synteza wielopoziomowych systemów hierarchicznych. Jednym z zasadniczych języków 
hierarchicznych systemów sterowania różnego rodzaju i metod wyznaczania optymalnych 
sterowań jest teoria gier ze zgodnymi interesami i prawem pierwszego ruchu. 


2. ROZGRYWAJĄCE STEROWANIE RUCHEM STATKU 
2.1. Rodzaje sterowania statkiem 


W celu zapewnienia bezpieczeństwa żeglugi statki zobowiązane są respektować reguły 
prawne w postaci zasad International Regulations for Preventing Collision at Sea (COLREG). 
Jednak te prawidła stosują się tylko do dwóch statków w zakresie dobrej widzialności, w 
warunkach ograniczonej widzialności zaś podają tylko zalecenia ogólnego charakteru i nie są w 
stanie uwzględnić wszystkich niezbędnych warunków rzeczywistego procesu. 

Tak więc rzeczywisty proces mijania się statków zachodzi w warunkach nieokreśloności i 
konfliktu przy nieścisłym współdziałaniu statków w myśl zasad COLREG. Dlatego celowe jest 
przedstawienie procesu oraz opracowywanie i badanie do celów eksploatacji metod bezpiecznego 
sterowania statkiem z zastosowaniem reguł teorii gier. Konieczność jednoczesnego 
uwzględnienia strategii spotkanych obiektów oraz własności dynamicznych statków jako 
obiektów sterowania przesądza o zastosowaniu do opisu procesu modelu gry dynamicznej, często 
nazywaną różniczkową [3,4,5,6,7,16,17]. 

Zakładając, że ruch dynamiczny statków w czasie odbywa się pod wpływem wielkości 
sterujących z odpowiednich dopuszczalnych zbiorów sterowania: 


)15( "مان اماع 
dzie: u! Ho) = zbiór strate 11 własne (0) statku,‏ 
8 8 0 8 


(u;) sy ZA) 
رنا‎ 7 - zbiór strategii j-tego spotkanego statku, 
)لا‎ Ho H; ( - 0 - oznacza stabilizację kursu lub trajektorii, 


Llo, H; ( - 1 - oznacza realizację manewru antykolizyjnego w celu minimalizacji ryzyka‏ الم 
kolizji, co w praktyce osiąga się spełnieniem następującej nierówności:‏ 
Di‏ 


min 


= min D;(t)> D, (16) 


0 
D min 


- najmniejsza odległość zbliżenia własnego statku i j-tego spotkanego obiektu, 
Dj - aktualna odległość do j-tego obiektu (z radarowego systemu antykolizyjnego ARPA), 
Dp - bezpieczna odległość zbliżenia w danych warunkach zależna od stopnia widzialności 
na morzu, prawideł COLREG oraz własności dynamicznych statku, 
U( Ho 4; J)=—1 - odpowiada manewrowaniu statkiem w celu osiągnięcia najmniejszej 


odległości zbliżenia — na przykład podczas przekazywania ładunku ze 
statku na statek, niszczenia okrętu nieprzyjaciela. 


Można wyróżnić, w przyjętej symbolice zapisu, następujące rodzaje sterowania ruchem statków 
dla osiągnięcia określonego celu: 


I. podstawowy rodzaj sterowania — stabilizacja kursu lub trajektorii: U, U;, 
II. unikanie kolizji za pomocą: 

a) manewrów własnego statku: U/U z, na przykład poprzez zmianę kursu o wartości 

Ay i/lub prędkości AV , 

b) manewrów spotkanego j-tego statku: U°U A ; 

c) manewrów kooperujących: U/U + 
III. spotkanie statków: U;'U > ; 
IV. sytuacje jednostronnej gry dynamicznej: U,'U j i UU 5 i 

Na przykład niebezpieczne sytuacje wynikłe z błędnej oceny procesu zbliżenia przez jedną 


ze stron przy braku obserwacji drugiej - jeden statek wyposażony w radar lub system 
antykolizyjny, drugi z uszkodzonym radarem lub bez tego wyposażenia, 


V. sytuacje pościgu, odpowiadające typowej konfliktowej grze dynamicznej: U,’U : iU ss 
Przy czym przypadki IV i V reprezentują gry konfliktowe, przypadki II i III są grami 
jednostronnymi, zaś przypadek I przedstawia zwykłe sterowanie optymalne. 


2.2. Podstawowy model gry dynamicznej 


1 1 3 
ا ا‎ ICE 
X; x7] 


Rys. 1. Schemat blokowy modelu gry dynamicznej statku. 


Najbardziej adekwatnym modelem procesu mijania się statku z j spotkanymi obiektami jest 
model gry dynamicznej j uczestników opisany przez równanie stanu: 


39 9 9 j Sn 4 vj m 
بذ‎ = CNA wady ge ول‎ (UO لزلا‎ ey ele Jf ] (17) 
i=1,2,...(j-9;+%), jf > 1,2, .., m 


gdzie: P% 4 (t)—9, wymiarowy wektor stanu statku, 


7 :. : 
Xj (t)-9,; wymiarowy wektor stanu j-tego obiektu, 


u, (t)-v, wymiarowy wektor sterowania statku, 
a, (t)—v; wymiarowy wektor sterowania j-tego obiektu. 


Ograniczenia stanu i sterowania wynikają z zachowania bezpiecznej odległości mijania Dp z 
zachowaniem prawnych reguł manewrowania COLREG: 


g(x uy )<0 (18) 


Synteza sterowania rozgrywającego statkiem polega na minimalizacji funkcji celu danej w 
postaci całkowej i końcowej: 


rå = gto] atr, talt) > min (19) 


Wypłata całkowa przedstawia straty drogi statku na wymijanie spotkanych obiektów, zaś wypłata 
końcowa określa końcowe ryzyko kolizji do j-tego obiektu i końcowe odchylenie statku od 
zadanej trajektorii statku [9,11]. 


2.3. Algorytm gry pozycyjnej 


Model gry dynamicznej sprowadza się do wieloetapowej gry pozycyjnej j uczestników 
niekooperujących ze sobą. Istotą gry pozycyjnej jest uzależnienie strategii własnego statku od 
aktualnych pozycji p(tk) spotkanych obiektów w aktualnym kroku k. W ten sposób uwzględnia 
się w modelu procesu ewentualne zmiany kursu i prędkości spotkanych obiektów w trakcie 
realizacji sterowania. Bieżący stan procesu jest określony przez współrzędne pozycji własnego 
statku i spotkanych obiektów. Układ generuje swoje sterowanie w chwili 44 na postawie danych, 
które otrzymuje z systemu antykolizyjnego ARPA o bieżącej pozycji statków. Zakłada się, 
zgodnie z ogólną koncepcją pozycyjnej gry wieloetapowej, że w każdej dyskretnej chwili czasu Ik 
na własnym statku znana jest pozycja obiektów. 

Ograniczenia współrzędnych stanu są ograniczeniami nawigacyjnymi, natomiast ograniczenia 
sterowania uwzględniają: kinematykę ruchu statków, zalecenia prawa drogi morskiej COLREG i 
warunek zachowania bezpiecznej odległości mijania według zależności (16). 


Zbiory domknięte (U , U p ), zdefiniowane jako zbiory dopuszczalnych strategii uczestników gry 


względem siebie, są zależne co oznacza, że wybór sterowania uj przez j obiekt zmienia zbiory 
dopuszczalnych strategii innych obiektów. Parametry tych zbiorów zależą od pewnej funkcji 
logicznej Z;, którą wyznacza się na drodze semantycznej interpretacji reguł COLREG, a następnie 
minimalizuje metodą tablic Karnaugha. 


Optymalne sterowanie własnym statkiem ugl t), równoważne dla aktualnej pozycji p(t) 
optymalnemu sterowaniu pozycyjnemu u¿( p ), wyznacza się w następujący sposób: 
- wyznacza się zbiory dopuszczalnych strategii U [p(t )] spotkanych obiektów względem 


własnego statku oraz wyjściowe zbiory UZ” [p(t | dopuszczalnych strategii własnego statku 
względem każdego ze spotkanych obiektów, 


względem każdego j obiektu wyznacza się parę wektorów u; i uj, a następnie optymalną 


strategię pozycyjną własnego statku up( p) z warunku: 


I*= min {mar min Solto(t JL,]t = Siol) Uj CUG" j=12,..,.m (20) 
uUo- fU} uj U j ug UG (u; ( 
jel 


Wielkość So oznacza ciągłą funkcję celu sterowania własnego statku, charakteryzującą odległość 
statku w chwili tx do najbliższego punktu zwrotu Lx na zadanej trasie rejsu. Kryterium wyboru 
optymalnej trajektorii własnego statku sprowadza się do wyznaczenia jego kursu i prędkości 
zapewniających najmniejsze straty drogi na bezpieczne mijanie spotkanych obiektów, w 
odległości nie mniejszej niż założona wartość Dp, z uwzględnieniem dynamiki statku w postaci 
czasu wyprzedzenia manewru. Optymalne sterowanie własnym statkiem oblicza się stosując 
wielokrotnie na każdym dyskretnym etapie ruchu statku metodę Simpleks do rozwiązywania 
zadania programowania liniowego [10]. 

Wykorzystując funkcję Ip — linear programming z Optimization Toolbox oprogramowania 
Matlab 7.1 opracowano algorytm GRAPOZ wyznaczania bezpiecznej trajektorii rozgrywającej 
statku w sytuacji kolizyjnej [15]. 


2.4. Algorytm gry macierzowej 


Pomijając równania dynamiki statku ogólny model gry dynamicznej procesu zapobiegania 
kolizjom sprowadza się do gry macierzowej j uczestników niekooperujących ze sobą. 
Macierz gry R=[r;(vo,v;)] zawiera wartości ryzyka kolizji r; wyznaczone w oparciu o dane z 
systemu antykolizyjnego ARPA dla dopuszczalnych strategii vo statku i dopuszczalnych strategii 
vj poszczególnych j spotkanych obiektów. 
Wartość ryzyka kolizji 7; definiuje się jako odniesienie aktualnej sytuacji zbliżenia, opisanej 
przez parametry لط‎ i Tj 


30 win do założonej oceny sytuacji jako bezpiecznej, określonej przez 
bezpieczną odległość zbliżenia Dp i czas bezpieczny Tp — niezbędne do wykonania manewru 


uniknięcia zderzenia, z uwzględnieniem aktualnej odległości D; statku do j spotkanego obiektu: 


r= 1 )21( 
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Ograniczenia na wybór strategii wynikają z zaleceń prawa drogi morskiej COLREG. Ponieważ 
najczęściej gra nie ma punktu siodłowego, więc nie ma zagwarantowanego stanu równowagi — 
brak jest w grze strategii czystych dla obu graczy. W celu rozwiązania tego problemu można 
posłużyć się dualnym programowaniem liniowym. W zagadnieniu dualnym gracz A dąży do 
minimalizacji ryzyka kolizji, natomiast gracz B dąży do maksymalizacji ryzyka kolizji. Składowe 
strategii mieszanej wyrażają rozkład prawdopodobieństwa użycia przez graczy ich strategii 
czystych. 


W rezultacie dla kryterium sterowania w postaci: 


(rj y = min max r; (22) 


vo Vj J 
otrzymuje się macierz prawdopodobieństwa P=[p;(vov;)] użycia poszczególnych strategii 
czystych. Rozwiązaniem zadania sterowania jest strategia o największym prawdopodobieństwie, 
która będzie zarazem optymalną wartością zbliżoną do strategii czystej [8]: 


(e) = [paa (23) 


Wykorzystując funkcję Ip — linear programming z Optimization Toolbox oprogramowania 
Matlab 7.1 opracowano algorytm GRAMAC wyznaczania bezpiecznej trajektorii rozgrywającej 
statku w sytuacji kolizyjnej [2]. 


3. BADANIA SYMULACYJNE 


Wyniki badań symulacyjnych algorytmów GRAPOZ i GRAMAC przeprowadzonych w 
oprogramowaniu Matlab/Simulink na przykładzie rzeczywistej sytuacji nawigacyjnej mijania się 
własnego statku z 42 spotkanymi obiektami, zarejestrowanej na ekranie radaru statku w Kanale 
La Manche przedstawiono na rysunkach 2 i 3. 

Rys. 2 obrazuje bezpieczne trajektorie rozgrywające statków według algorytmu GRAPOZ dla 
kryteriów: a) min max min, b) min min min, c) min, zaś rys. 4 według algorytmu GRAMAC dla 
strategii: a) vo=13, vj=25; b) vo=13, vj=3; c) vo=3, vj=3. 


4. WRAŻLIWOŚĆ STEROWANIA ROZGRYWAJĄCEGO 

Uwzględniając praktyczne zastosowanie algorytmu rozgrywającego sterowania własnym 
statkiem w sytuacji kolizyjnej celowe jest przeprowadzenie analizy wrażliwości sterowania 
bezpiecznego z jednej strony na stopień dokładności informacji z systemu antykolizyjnego o 
aktualnej sytuacji zbliżenia, z drugiej zaś na zmiany parametrów kinematycznych i 
dynamicznych procesu sterowania [12,13,14]. 
4.1. Wrażliwość sterowania na niedokładność informacji o stanie procesu 

Niech p, określa zbiór informacji z systemu ARPA o sytuacji nawigacyjnej: 


zaś p, określa zbiór informacji obarczony błędami pomiarów i przetwarzania: 


p, =(V+ÓV,y LOW ,V; HOV; WV; LOW „D,+ÓD,,N,+óN,) (25) 
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Rys. 2. Symulacja komputerowa algorytmu GRAPOZ. Rys. 3. Symulacja komputerowa algorytmu GRAMAC. 


Względna miara wrażliwości wypłaty końcowej gry jako odchylenia końcowego bezpiecznej 
trajektorii statku dx od zadanej trajektorii wyniesie: 


, 0022, 
S7 =( pj, pi )= TĘ PEBL a (26) 
k( Pi 
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4.2. Wrażliwość sterowania na zmiany parametrów procesu 


Niech p, określa zbiór parametrów kinematycznych i dynamicznych procesu: 
P2 =f tw Dp Tp, Atp, AV } (27) 
zaś Po określa zbiór zmienionych parametrów procesu: 
P> ={t, +t, D, £6D,,T, + AT,, At, + SAt, AV + SAV } (28) 


Względna miara wrażliwości wypłaty końcowej gry jako odchylenia końcowego bezpiecznej 
trajektorii statku dx od zadanej trajektorii: 


á dil Babo) 
وم ,وم )= رک‎ ( 6 
d,( P>) (29) 
S2 = sy sP, 85°, szk sev } 


gdzie: 


tw - czas wyprzedzenia manewru uwzględniający własności dynamiczne własnego statku, 

At, - czas trwania jednego etapu trajektorii statku, 

Dp, Tp - odległość i czas bezpieczny, 

AV - zmniejszenie prędkości własnego statku dla odchylenia od kursu większego niż 30°. 

Na rysunkach 4 i 5 przedstawiono charakterystyki wrażliwości, które otrzymano na drodze 
komputerowej symulacji algorytmów sterowania rozgrywającego w oprogramowaniu 
Matlab/Simulink, dla zmian wielkości p; i p2 w zakresie +5% lub +3°. 


5. WNIOSKI 


Zastosowanie uproszczonych modeli gry dynamicznej procesu do syntezy optymalnego 
sterowania umożliwia wyznaczenie bezpiecznej trajektorii rozgrywającej statku w sytuacjach 
mijania się z większą ilością spotkanych obiektów jako pewnej sekwencji manewrów kursem i 
prędkością. 
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Opracowane programy komputerowe uwzględniają reguły prawa drogi morskiej COLREG i czas 

wyprzedzenia manewru aproksymujący własności dynamiczne statku oraz oceniają odchylenie 

końcowe trajektorii rzeczywistej od zadanej. Wrażliwość wypłaty końcowej mierzona 

względnym odchyleniem końcowym trajektorii rozgrywającej od zadanej: 

- najmniej zależy od okresu dyskretyzacji trajektorii i czasu wyprzedzenia manewru, 

- najbardziej zależy od zmian prędkości i kursu własnego statku oraz spotkanego obiektu, 

- rośnie ze stopniem rozgrywającego charakteru procesu sterowania oraz ilością dopuszczalnych 
strategii własnego statku i spotkanego obiektu. 

Rozpatrywane algorytmy sterowania są w pewnym sensie formalnymi modelami procesów 

decyzyjnych oficera nawigatora prowadzącego statek i mogą być zastosowane do 

konstruowania, zarówno odpowiednich symulatorów szkoleniowych w uczelniach morskich, jak 

i różnych opcji pokładowego systemu antykolizyjnego ARPA. 
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GAME THEORY METHODS IN SHIP CONTROL 


Abstract: The paper introduces the application of selected methods of game theory for automation of 
the processes of moving object steering and the game control processes in marine navigation and 
mathematical models of safe ship control. The control goal is defined first followed by a description of 
the base model and a presentation of approximated models of a safe ship steering in a collision 
situation. For each approximated model of the dynamic game, an appropriate method of safe steering 
to support the navigator's decision in a collision situation has been assigned. The Positional Game 
(GRAPOZ) and the Risk Game (GRAMAC) control algorithms have been designed in the MATLAB 
language. The considerations have been illustrated an example of a computer simulation of the 
GRAPOZ and GRAMAC algorithms to determine the safe ship's trajectory in situations of passing 
many of the objects encountered, recorded on the ship’s radar screen in real navigational situation at 
sea. Finally, the sensitivity of ship game control to inaccurate data from the ARPA anti-collision radar 
system is presented. 


Key Words: Differential games, matrix games, positional games, dual linear programming, safety 
analysis, risk analysis, ship control, computer simulation. 


